马蜂窝被“捅”了!2100万“真实点评”有85%是抄的?公司回应:胡说!
以用户内容起家、国内最大的自由行交易平台马蜂窝,这次被“捅”了。
马蜂窝用户评论被指超八成造假
10月21日,一篇名为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的自媒体文章引发热议。
该文称,一家名为“乎睿数据”的团队,通过数据抓取和分析,发现马蜂窝上有七千多个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评。
合计抄袭572万条餐饮点评、1221万条酒店点评,占到其官网声称总点评数的85%。
图片来自“小声比比”
该文称,抄袭账号出现了诸多自相矛盾的现象。如某账号点评内容显示该用户一天内同时出现在三地酒店,住宿对象也在男女之间切换。部分点评中出现捉奸、纪检处理结果等内容,被指不慎抓了不该抓取的东西。
该文称,这些抄袭账号除了贡献内容和活跃度之外,也活跃在各种官方抽奖之中,并屡次成为“幸运得主”。如一个节选式抄袭账号,连续中奖12次;一位发帖称抢到2次福利性质抢购的用户,被发现其ID为马蜂窝内部员工。
乎睿数据公司发布的分析图
在刨除了七千多个作弊账号后,该团队在所有账号中选择了15000个最活跃账号。发现这些账户在2015年中旬突然同时活跃,到2016年初又同时沉寂,出奇一致。
此外,该团队马蜂窝大部分用户集中在周内写餐饮和酒店点评,周末活跃度则断崖式下降。
乎睿数据公司发布的案例图
该文调侃,马蜂窝的主流用户“是一群每天朝九晚五吃喝玩乐、在午晚饭以及周末干正事、能够同时出现在地球不同地方且反复切换性取向的人。”暗指马蜂窝账号造假。
马蜂窝官网称其目前有2100万条“真实点评”。
爆料人:本意想用马蜂窝训练模型
文章作者梓泉称,乎睿数据团队花了4个月时间做了马蜂窝的调查。文中得出马蜂窝“抄袭点评数量占85%”的统计结论,先通过比对点评内容来找到抄袭账号,抄袭不同大众点评账号150条以上的账号算作一个抄袭账号,然后计算抄袭账号所发布的全部点评,占马蜂窝总体点评数量的占比。
梓泉解释其团队判定抄袭内容的标准:“第一是马蜂窝的内容,同时和多个来源重叠,总不可能这么多家抄一个人嘛,这个概率太小了。第二是存在大量外语翻译的内容。第三是人称指代前后冲突。四是点评的时间戳有人为修改痕迹。”
不过对于这份统计结果,有从事零售电商行业的网友认为其中存在破绽,“马蜂窝把内容当作社区运转的核心,积累了8年,却被先入为主地说成马蜂窝抄袭爬取对方数据,而大众点评此前被曝光爬取他人数据不止一回了。”
马蜂窝回应:涉嫌假评的账号占比极少
22日上午,马蜂窝发布声明称,点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的账号数量在整体用户中的占比微乎其微,马蜂窝已对这部分账号进行清理。
自媒体文章将不法商家的违规行为归结于马蜂窝,所述的马蜂窝用户数量,与事实和第三方机构数据严重不符。
马蜂窝公司的声明全文
声明称,上述自媒体还将马蜂窝用户内容生产的活跃周期,与餐饮等本地生活服务类APP相对比,并解读为马蜂窝员工有组织的抄袭,存在明显误导倾向。
声明还称,针对文中歪曲事实的言论,和已被查证的有组织攻击行为,将采取法律手段维护自身权益。
马蜂窝新一轮融资前遭遇危机
从事互联网法律研究的中国政法大学副教授朱巍说,这种爬取竞争对手数据的行为,涉嫌反不正当竞争法。
2006年,曾经在国内最早一批门户网站工作的陈罡和吕刚,因为自助旅游、探险的爱好,一起创建了马蜂窝,并逐渐在国内聚集起一批驴友,分享各自的驴友攻略和贴士,2010年时发展到10万用户的规模,逐渐形成社群。
旅行达人章鱼说,自己在国内旅游经常使用马蜂窝,是因为喜欢去小众冷僻的地方,这些地方的信息通常很难查到,而马蜂窝的游记里常常有细致具体的内容,有的来自用户的补充,譬如某个偏僻目的地住宿的联系方式。
今年8月路透社曝出马蜂窝有望获得新一轮3亿美元融资的消息,并有可能在这轮融资中获得20至25亿美元估值。
对于在这样敏感时期曝出爬取用户点评的负面消息,有旅游投资行业从业者认为,可能对马蜂窝的核心价值影响有限。
“现有估值的核心一定是交易额。”海泽资本创始人罗海资分析称,“评论自产的多少是著作权问题,马蜂窝于理有亏,如果被起诉,恐怕也有违法之嫌,但对估值影响恐怕不大。消费者要的还是评论丰富、覆盖广、有充足的商品量。”
北京联合大学副研究员杨彦锋也认为,“从交易量和访问量来看,马蜂窝的商业模式已经经过实证的检验,而且非常有效。”
但自由行交易平台的模式,存在商家质量把控和平台服务有短板的风险。譬如去年有消费者称,在马蜂窝平台购买的里斯本一日游产品,在途中遇到导游甩客。不久前,马蜂窝又出现由于系统问题订错酒店,客服疏忽、让用户从海参崴打车到希腊的事件。
互联网企业相互抄袭成常态
去年自媒体爆料今日头条的悟空问答挖走300多个知乎大V的时候,马蜂窝CEO陈罡在知乎上发了一问题,鼓舞知乎创始人周源,“你相信凭砸钱、抓取、抄袭能Copy一个社区吗?”他说到,“作为这种事件的亲历者,蚂蜂窝的旅游社区达人和高质量的旅游内容向来被各色旅游行业的成名大咖和江湖喽啰青睐有加,来重金收买的,送ipad搬家的,500元求一条酒店点评的,Spider连抓带扒的...... 各种套路层出不穷。”不知道他如今是何感想。
今年7月,小红书发布声明,指责大众点评大量抄袭小红书用户内容,认为大众点评批量建立虚假账号,抄袭及搬运用户在小红书发布的原创笔记。可见抄袭用户点评现象,在内容聚合型的互联网企业间并不罕见。
此前的事件还有百度抓取大众点评用户评论,因不正当竞争被法院判处323万元赔款,之后又被马蜂窝用户投诉抄袭了自己的马蜂窝游记,最后的处理结果是将投诉涉及的4篇游记删除并封号。更早时候,豆瓣“足迹”团队抓取穷游的地理数据,最后CEO杨勃公开致歉并关停了“足迹”。
在某家OTA从事产品设计的业内人士称,互联网企业,尤其电商中的爬取数据行为是常见现象,爬虫和反爬虫都是动态的斗争,没法屏蔽,但也是违法行为。“每个网站都有一个robot.txt文件,告诉网络爬虫哪些站点可以爬哪些不可以爬,但一般都不遵守这个文件。比如零售电商爬取竞争对手价格,同质化的产品相互比价。”
本文综合自: 澎湃新闻 界面新闻 新京报
相关作者:赵思维 陈兴王 郑萃颖
微信编辑:大白
你或许还想看↓↓↓
岳云鹏怒怼机场天价“酱油面”,当地回应来了,网友却说....
这家新晋网红面包店是“farine原班人马打造”?老板回应了......
觉得文章不错,那就点个赞吧↓↓↓